כוונון עדין של מודל Gemma

כשמשנים את ההגדרות של מודל בינה מלאכותית (AI) גנרטיבי כמו Gemma, משנים את התנהגות המודל. בדרך כלל משנים את ההגדרות של Gemma כדי לשפר את הביצועים שלה במשימה או בדומיין ספציפיים, או כדי לשפר את התפקיד שלה, כמו שירות לקוחות. מודלים של Gemma מוצגים עם משקלים פתוחים, כלומר אפשר לשנות את המשקלים האלה וכך לשנות את התנהגות המודל. השלבים הכלליים לשיפור מודל Gemma הם:

בחירת מסגרת

המודלים של Gemma תואמים למגוון מסגרות לכוונון AI. לכל מסגרת יש יתרונות שונים, והיא מוגבלת בדרך כלל לפורמט ספציפי של מודל. ריכזנו כאן מדריכים לכוונון מודלים של Gemma באמצעות מסגרות שונות:

חשוב לוודא שפורמט מודל הפריסה המיועד, כמו פורמט Keras,‏ Safetensors או GGUF, נתמך כפלט על ידי המסגרת שבחרתם.

איסוף נתונים

כדי לבצע התאמה של מודל נדרשים נתונים. נתוני כוונון בדרך כלל מורכבים מזוגות של נתוני קלט עם התגובה הצפויה. יש הרבה מערכי נתונים ציבוריים שזמינים באינטרנט לצורך אימון למשימות או לתוצרים שונים. לדוגמה, אם רוצים לאמן מודל Gemma כדי לתרגם תיאורים של חלקי רכב למספרי חלקים, מערך הנתונים עשוי לכלול את הנתונים הבאים:

training_data = [
  {"input_text": "Part number for A4 brake caliper", "output_text": "4M0615107BS"},
  {"input_text": "Part number for Beetle fuel pump", "output_text": "6A127026H"},
  {"input_text": "Part number for Camaro cylinder head", "output_text": "12711770"},
]

אם רוצים שמודל Gemma יבצע קבוצה ספציפית של משימות או תפקיד, בדרך כלל צריך ליצור מערך נתונים שמציג כמה וריאציות של המשימה הזו. כמות הנתונים שדרושה כדי לכוונן מודל תלויה ביעדים שלכם, במיוחד במידה שבה אתם רוצים שהמודל ישנה את ההתנהגות ובאיזה רמת ביצועים אתם רוצים שהמודל יפעל, בהתאם למשימה שרוצים להשלים ורמת השונות בנתוני הקלט.

באופן כללי, מומלץ להתחיל עם קבוצה קטנה של נתונים לכוונון המשימה, לשנות את פרמטרים של האימון ולהוסיף נתונים עד שמגיעים לביצועים של המשימה שמתאימים לצרכים שלכם. בחלק מהאפליקציות לדוגמה שלנו אפשר לראות שאפשר להשפיע על ההתנהגות של מודל Gemma באמצעות 20 זוגות של הנחיה ותגובה בלבד. פרטים נוספים זמינים במאמרים יצירת עוזרת AI לאימייל עסקי באמצעות Gemma ומשימות בשפות מדוברות באמצעות Gemma.

כוונון ובדיקה של המודל

אחרי שתגדירו מסגרת לכוונון ונתוני כוונון, תוכלו להתחיל בתהליך הכוונון של מודל Gemma. כשמבצעים כוונון, יש כמה אפשרויות לכוונון שמשפיעות על המשאבים הנדרשים להשלמת התהליך. מומלץ גם להכין תוכנית בדיקה למודל המכוונן כדי לבדוק אם הביצועים שלו עומדים בציפיות שלכם אחרי הכוונון.

כוונון יעיל בפרמטרים

כשמבצעים כוונון עדין של מודל עם משקלים פתוחים כמו Gemma, יש לכם אפשרות לכוונן את כל הפרמטרים של המודל או להשתמש בשיטת כוונון יעילה יותר של פרמטרים שמשתמשת בפחות משאבים ומעדכנת קבוצת משנה שלהם. הגישה המלאה לכוונון מתייחסת למצב שבו בזמן החלת נתוני הכוונון, מחשבים משקלים חדשים לכל הפרמטרים של המודל. הגישה הזו דורשת הרבה משאבי מחשוב וזיכרון, כי מבצעים את החישובים האלה עבור מיליארדי פרמטרים. שימוש בגישות כוונון פחות צורכות משאבים, שנקראות כוונון יעיל בפרמטרים (PEFT), כולל שיטות כמו כוונון של מתאם דירוג נמוך (LoRA), יכול להניב תוצאות דומות עם פחות משאבי מחשוב. במאמרים ביצוע כוונון עם פחות משאבים באמצעות LoRA ב-Keras וביצוע כוונון של מודלים של Gemma ב-Hugging Face מוסבר איך לבצע כוונון באמצעות LoRA.

בדיקת מודלים מותאמים

אחרי שתכווננו מודל למשימה ספציפית, כדאי לבדוק את הביצועים שלו ביחס לקבוצת המשימות שאתם רוצים שהוא יבצע. מומלץ לבדוק את המודל באמצעות משימות או בקשות שלא אומנו במיוחד עבורו. אופן הבדיקה של המודל המכוונן תלוי במשימה שאתם רוצים שהוא יבצע ובמידת הבקרה שלכם על נתוני הקלט והפלט של המודל. דרך נפוצה לניהול בדיקות של מודלים גנרטיביים היא להשתמש בתרחישים של הצלחה, כשל ותרחישים גבוליים:

  • בדיקות הצלחה: בקשות שהמודל המכוונן תמיד יוכל לבצע בהצלחה.
  • בדיקות כשל: בקשות שהמודל המכוונן לא תמיד יוכל לבצע, או שיסרב לבצע באופן מפורש, אם יתבקש.
  • בדיקות גבול: בקשות שהמודל המכוונן אמור לבצע, אם הן נמצאות בגבול מוגדר או בקבוצת גבולות מוגדרים של התנהגות פלט מקובלת.

כשבודקים תנאי כשל או תנאי גבול באפליקציה של AI גנרטיבי, צריך להשתמש גם בשיטות, בכלים ובגישות הבטיחות של AI גנרטיבי כפי שמתואר בערכת הכלים ל-AI גנרטיבי אחראי.

פריסת המודל

אחרי שתסיימו את ההתאמה והבדיקה, תוכלו לפרוס את המודל. בדרך כלל אפשר להיעזר במסמכי התיעוד של המסגרת שבחרתם כדי לפרוס מודל מותאם.

אם אתם פורסים מודל עם משקלים מותאמים של LoRA, חשוב לזכור שבשיטה הזו בדרך כלל פורסים גם את המודל המקורי וגם את המשקלים שלו עם משקלי LoRA כשכבת חישוב נוספת של המודל.